【Day 5】YOLO的版本迭代介紹之 3

2024 iThome 鐵人賽

DAY 5

AI/ ML & Data

我的深度學習-從0開始實作物件偵測系列第 5 篇

16th鐵人賽

Xiang

2024-09-13 01:55:08

460 瀏覽

分享至

一、前言

版本迭代的最終篇，接續前2篇對YOLO迭代的基礎介紹，接著要說明的是由v7到v9的演變，那就開始吧！

YOLO v7

主要分成兩個方面去優化：模型架構優化和訓練過程優化

借鑒了YOLO v5、Scale YOLO v4、YOLOX，「拓展」和「複合縮放」方法，以便高效的利用參數和計算量。
提出了一種新的標籤分配方法。

v7的測試對比。 YOLO v7 Paper

YOLO v8

利用了與YOLOv5類似的程式碼，但採用了新的結構，其中使用相同的程式碼來支援分類、實例分割和物件偵測等任務類型。模型仍然使用相同的YOLO v5 YAML格式初始化，資料集格式也保持不變。

v8相較於前幾代的優勢：

更友好的安裝/運作方式
速度更快、準確率更高
新的backbone，將YOLO v5中的C3更換為C2F
YOLO系列第一次嘗試使用anchor-free

YOLO v9

使用了Programmable Gradient Information, PGI 和一種新的輕量架構 — Generalized Efficient Layer Aggregation Network, GELAN 來處理深度神經網路中的訊息損失問題。

v9的優勢：

性能提升：YOLO v9 在物體檢測的精度和速度方面，具有進步和優勢。
效率優化：在保證高性能的同時，也實現了模型效率的顯著提升。
泛化能力：在多種不同類型的數據集上都能達到優異的性能。

MS COCO 資料集上即時目標偵測器的比較。圖片來源：YOLO v9 Paper

二、結論

在這個YOLO的版本迭代的系列中，雖然內容較於枯燥乏味，筆者也花了大量時間去閱讀不同的文章和論文。通過理解了YOLO演算法的各個版本，對於YOLO的原理以及改動的項目有了更深度的理解。學習這些不僅對YOLO的技術有了更深入的了解，還學習到了很多視覺領域的最新研究和發展。希望這個系列能幫助讀者們更好的理解和應用YOLO技術，並激發大家對物件偵測的技術有更多的興趣。

接著要來說說YOLO是怎麼運作的，感謝各位的觀看，我們下篇見。